Банки нуклеотидеых последовательностей

Задание 1. Качество сборки генома Phoenicopterus ruber ruber

Название: Красный фламинго (лат. Phoenicopterus ruber ruber)

Краткое описание: вес красного фламинго 2-2.5 кг, обитает в лагунах и соленых озерах

картинка
Файл .fasta
Название сборки (Assembly name) ASM68726v1
AC сборки из RefSeq GCA_000687265.1
Общая длина 1,132,184,511
Число контигов 137,480
Число скэффолдов 76,189
N50 (скэффолд) 38,071
L50 (скэффолд) 8,592
N50 (контиг) 20,262
L50 (контиг) 16,707
Число аннотированных белков 12142
Ссылка на описание проекта GenBank

Задание 2. Изучение последовательности CDS одного из прокариотических вирусов

Для поиска полных геномов прокариотических вирусов я использовала раздел Nucleotide базы данных NCBI. Установленные ограничения на поиск: Organism: Siphoviridae; Sequence Length: 10000:20000. Текст запроса выглядел следующим образом: (Siphoviridae) AND 10000:20000[Sequence Length]. Всего находок получилось 374. Из GenBank 363 и из RefSeq 11 находок.

Был выбран полный геном Microbacterium phage TeddyBoy. Его характеристики:

AC нуклеотидной записи MN428062
Название Microbacterium phage TeddyBoy
TaxID 2652885
Тип генома Линейная ДНК
Хозяин вируса Бактерия

Для получения fasta файла я воспользовалась Send to -Coding sequences - File

Файл .fasta

Задание 3

Описание ключей было получено из INSDC.

Название ключа Описание ключа Пример
1 sig_peptide кодирующая последовательность сигнального пептида; кодирующая последовательность для N-терминального домена секретируемого белка
sig_peptide     446..499
                     /gene="Lyz"
                     /allele="B"
2 protein_bind Этот ключ соответствует сайту связывания белка в ДНК.
 protein_bind    204..229
                     /locus_tag="Os08g0535200"
                     /bound_moiety="PthXo1"
3 rep_origin Точка начала репликации (origin of replication) - фрагмент нуклеиновой кислоты, с которой начинается её репликация.
 rep_origin      6629..7184
                 /note="ColE1 origin; origin polarity and direction of
                 RNAII pointed toward CMV enhancer/promoter" 
                    
4 intron Интрон - это часть ДНК, которая удаляется из РНК во время сплайсинга.
intron          1583..2354
                     /number=1
5 regulatory Любой участок последовательности, отвечающий за регуляцию транскрипции, трансляции, репликации или структуры хроматина
 regulatory      4079..4084
                 /regulatory_class="polyA_signal_sequence"
                 /gene="LOC101055591"
                 /gene_synonym="SW5F"    
6 variation Означает естественный полиморфизм и мутации
variation       2626
                     /gene="pho1"
                     /pseudo
                     /compare=AB441692.1
                     /allele="pho1-1"
                     /replace="g"
7 stem_loop Шпилька- образуется в том случае, когда две последовательности одной и той же цепи комплементарны друг другу и соединяются друг с другом, перегибаясь одна к другой и образуя на конце неспаренный участок — петлю
stem_loop       274..289